Estatística Descritiva

Aulas VI e VIII - Versão Alunos

Luiz Diego Vidal Santos

Universidade Estadual de Feira de Santana (UEFS)

Estatística Descritiva

O que são

A estatística descritiva é um ramo da estatística que aplica várias técnicas para descrever e sumarizar um conjunto de dados.

Enquanto a estatística descritiva se limita a resumir e apresentar os dados, a estatística inferencial busca fazer afirmações sobre uma população com base em informações de uma amostra.

O que aprenderemos

🔹 Medidas de tendência central

  • Média simples
  • Moda
  • Mediana

🔹 Separatrizes

  • Mediana, Quartis, Decis, Percentis

🔹 Medidas de dispersão

  • Variância
  • Desvio-padrão
  • Erro-padrão
  • Intervalo de Confiança

🔹 Escore Z

  • Transformação em unidades de desvio-padrão

II. Medidas de Dispersão

Objetivos e Principais Medidas

Objetivos

  • Quantificar a variabilidade
  • Comparar grupos
  • Detectar outliers
  • Apoiar a tomada de decisão

Principais Medidas

  • Variância (\(s^2\)): média dos quadrados dos desvios
  • Desvio-Padrão (\(s\)): raiz quadrada da variância
  • Erro-Padrão (EP): precisão da média amostral

Exemplo - Criando os Dados

dados <- data.frame(
  cidade = c('Feira de Santana', 'Salvador', 'Vitória da Conquista',
             'Juazeiro', 'Itabuna', 'Paulo Afonso'),
  altitude_m = c(234, 8, 923, 368, 110, 80),
  temp_media_c = c(24.8, 26.3, 21.2, 27.1, 25.4, 38.5)
)
dados

1.1 - Média

\[\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i\]

media_alt <- mean(dados$altitude_m)
media_alt

1.2 - Variância

\[s^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}\]

# Complete o código para calcular a variância da temperatura

2.1 - Desvio-Padrão

\[s = \sqrt{s^2}\]

sd_alt <- sd(dados$altitude_m)
# Complete: calcule o desvio-padrão da temperatura

2.3 - Coeficiente de Variação

\[CV = \frac{s}{\bar{x}} \times 100\%\]

Útil para comparar variabilidade entre variáveis com unidades diferentes (ex: m vs. °C).

# Complete: crie uma função para calcular o CV

2.2 - Erro-Padrão

\[EP = \frac{s}{\sqrt{n}}\]

ep <- function(x, na.rm = TRUE) {
  if (na.rm) x <- x[!is.na(x)]
  sd(x) / sqrt(length(x))
}
EP_alt <- ep(dados$altitude_m)
EP_alt

2.2 - Escore Z

\[Z_i = \frac{x_i - \bar{x}}{s}\]

# Complete: calcule o escore Z para altitude

2.3 - Intervalo de Confiança

\[IC = \bar{x} \pm Z_{\alpha/2} \times EP\]

# Complete: calcule o IC 90%, 95% e 99%

Obrigado!

Luiz Diego Vidal Santos

Universidade Federal de Sergipe

diego@academico.ufs.br